Importando bibliotecas que serão utilizadas
library(dplyr)
library(purrr)
library(plotly)
library(janitor)
library(ggplot2)
library(corrplot)
source("multiplot.R")
Carregando base e melhorando nome das colunas
base::load("../inputs/us_change.rda")
data <- us_change %>% janitor::clean_names()
calc_indice <- function(x) {
y <- x
y[1] <- 100
for(i in 2:length(x)) {
y[i] <- (x[i]/x[i-1]) * y[i-1]
}
return(y)
}
calc_indice_variacao <- function(x) {
y <- x
y[1] <- 100
for(i in 2:length(x)) {
y[i] <- (1 + x[i]/100) * y[i-1]
}
return(y)
}
data_indice <- data %>%
dplyr::filter((quarter >= as.Date("2000-01-01"))) %>%
dplyr::select(-quarter) %>%
purrr::map_df(function(x) x %>% calc_indice_variacao())
quarters <- data %>%
dplyr::filter((quarter >= as.Date("2000-01-01"))) %>%
dplyr::select(quarter)
data_indice <- data_indice %>%
dplyr::mutate(quarter = quarters$quarter)
Plotando variáveis para efeito de verificação
correl <- stats::cor(data_indice %>%
dplyr::select(-quarter))
## consumption income production savings unemployment
## consumption 1.00000000 0.99511754 0.7558454 0.07822587 -0.11691529
## income 0.99511754 1.00000000 0.7277307 0.17080259 -0.08431893
## production 0.75584542 0.72773073 1.0000000 -0.12579960 -0.54518215
## savings 0.07822587 0.17080259 -0.1257996 1.00000000 0.17372121
## unemployment -0.11691529 -0.08431893 -0.5451822 0.17372121 1.00000000
Criando a correlação entre as variáveis utilizando das variáveis em taxa de variação
correl <- stats::cor(data %>%
dplyr::filter((quarter >= as.Date("2000-01-01"))) %>%
dplyr::select(-quarter))
## consumption income production savings unemployment
## consumption 1.0000000 0.22891397 0.48396431 -0.24460544 -0.47826764
## income 0.2289140 1.00000000 0.14337067 0.84544089 -0.09033545
## production 0.4839643 0.14337067 1.00000000 -0.06058825 -0.72529302
## savings -0.2446054 0.84544089 -0.06058825 1.00000000 0.11381076
## unemployment -0.4782676 -0.09033545 -0.72529302 0.11381076 1.00000000
Como pode-se perceber a correlação em ambos os casos foi a mesma, isto ocorre pois as duas bases estão com suas variáveis em nível, desse modo não existe diferença em calcular a correlação com as variáveis em número índice e em taxa de variação.
A partir dos gráficos construídos é possível identificar que as variáveis apresentam uma evolução no tempo com bastantes picos, tanto positivos quanto negativos, isto ocorre devido aos diversos eventos externos que influenciam diretamente na economia do país. Além disso, as variáveis que apresentam uma maior correlação, como por exemplo poupanças e renda, sofrem os efeitos de tais eventos de forma bastante correleta, baseando sempre na matriz de correlação, construída em itens anteriores.
É possível encontrar nas séries alguns movimentos abruptos, como nos anos por volta de 1980 em que os EUA sofreram por um grande período de instabalidade econômica, muito pelo fato de não saber se comportar em frente a novos concorrentes do mercado internacional, além de questões complicadas envolvendo o Oriente Médio. Também é possível identificar movimentos abruptos por volta de 2008-2009, em que os EUA passavam pela sua maior recessão financeira desde 1930.